资本在说话,中国大模型公司再迎新一轮风投,显眼包是它们
元界由《权力、资本与商帮》作者王俞现 主理。『未来之光·元界元宇宙星辰榜』开评,中国元宇宙区县TOP榜、中国元宇宙乡镇TOP榜、中国元宇宙产业园TOP榜,征集中。
从全球来看,大模型创业公司一边排队求卖身,一边5月人工智能公司融资创单月新高。
而继2月月之暗面(Kimi),3月爱读科技、生数科技、智谱AI,4月面壁智能等中国大模型公司获得一轮融资后,5月下旬以来,中国大模型公司再获新一轮融资,或正走在融资的路上。
而从中美来看,从中国大模型公司生数科技大量工作被OpenAI、Stable Diffusion团队引用,到斯坦福AI团队抄袭中国大模型公司面壁智能事件,中美在人工智能领域的竞争,差距还有多大?
金字塔尖与底端的分化
2024年的全球人工智能领域,融资活动如火如荼,却也呈现出冰火两重天的局面。
一方面,2024年5月,全球AI初创企业共筹集了超过125亿美元的资金,刷新了AI领域单月融资的记录。以xAI、CoreWeave、Wayve、Scale AI为代表的明星企业,凭借其创新技术和市场潜力,收获了巨额融资,估值屡创新高。
马斯克的xAI以60亿美元的B轮融资额领跑,其估值达到240亿美元,全球范围内仅次于OpenAI,位列第二。而CoreWeave、Wayve和Scale AI等企业的成功融资,标志着AI在云服务、自动驾驶、数据标注等领域的深度应用获得资本市场的强烈认可。
Suno AI、Motional、DeepL、Vercel、H以及The Bot Company等其它几家公司也分别完成了数亿美元的融资,涵盖音乐生成,自动驾驶、语言翻译、前端云平台、AI代理以及家庭机器人等多个领域。
然而,这股热潮并未惠及所有初创公司。据外媒近期报道,多家美国生成式AI公司深陷资金链断裂困境。
由前OpenAI工程师和谷歌研究员创办的AI初创公司Adept正与Meta等投资方洽谈收购;大语言模型Reka AI被曝可能将被数据公司Snowflake以10亿美元收购;因Stable Diffusion模型而一战成名的AI明星创业公司Stability AI由于现金短缺,正在与多位买家沟通出售事宜。
这揭示了AI领域内部分化的严峻现实。
中国大模型公司又现新一轮融资潮
2月,中国大模型新秀公司月之暗面,获得新一轮融资。从估值3亿美元到融资超10亿美元,他仅用8个月|中国未来产业100人
3月11日,由字节跳动前视觉技术负责人王长虎创办于2023年4月的爱诗科技宣布完成亿级人民币A1轮融资。爱读科技专注解决AI视频大模型及应用。此轮融资由国内一线投资机构达晨财智领投,光源资本担任独家财务顾问。
次日传出信息,清华系北京生数科技有限公司宣布完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。本轮由华兴资本担任独家财务顾问。对标Sora,中国版Vidu来了!北京:5年超千亿,加速通用AI发展
14日,国内头部大模型初创公司智谱AI传出2024年初已完成新一轮融资,北京市人工智能产业投资基金参与投资。这是北京市人工智能产业投资基金自去年9月成立以来投资的第一家AI大模型公司。百亿估值大模型公司再获融资,国资背景基金出手,三大看点
4月,清华系面壁智能公司,获得新一轮融资。性能超Llama2-13B,华为哈勃、北京国资基金刚投,吴恩达点赞
进入5月下旬以来,以智谱AI和生数科技为代表,中国头部大模型公司有望又掀起另一轮融资。
大模型公司月之暗面(Moonshot)被曝正在融资,最新一轮的估值报价已达30亿美金。有知情人透露,新入局的包括腾讯、高榕创投等机构。这也意味着,中国大模型创业公司已经踏入200亿人民币俱乐部。
5月31日,据Financial Times报道,中东石油巨头沙特阿美旗下风险投资部门管理的基金Prosperity7,投资了中国大模型独角兽智谱AI,金额达到4亿美元(约29亿元),这笔投资将使智谱AI的估值达到约30亿美元。
智谱AI扎堆了来自阿里、腾讯、美团、蚂蚁、小米、金山、顺为、红杉、高瓴等互联网战投和VC的融资。此次融资是中国大模型初创公司拿下的第一笔国外投资。
2020年,Prosperity7在中国设立办公室。自2021年起,Prosperity7就投资了包括Zilliz、曦智科技、宏景智驾、节卡机器人在内的20多家中国企业。其中,AI和机器人是Prosperity7重点布局的领域。
Prosperity7中国董事总经理张柏舟曾在采访中表示,“我们坚定地看好中国。不仅是中国团队看好这里,我们在总部和全球其他地区的同事们也相信这一点。”
据Financial Times报道,一位Prosperity7相关人士表示:“沙特不希望硅谷在这个行业占据主导。”
6月5日,证券时报记者从多方获悉,生数科技完成数亿元Pre-A轮融资。本轮融资由百度、北京市人工智能产业投资基金领投,中关村科学城公司、启明创投等跟投。
虽然智谱与百度均在大模型方面有所布局,但生数科技CEO唐家渝回应称,智谱与百度的模型产品均偏向语言模型,更看重理解和逻辑推理能力,与生数科技的多模态能力为互补与合作关系。
本轮融资完成后,生数科技将坚持其原生通用多模态技术路线,持续迭代优化自研大模型,并加速产品开发与市场拓展。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,投资生数科技是百度在多模态大模型领域的重要战略布局。未来,百度将发挥自身在AI异构算力、大模型平台、生态等方面的独特优势,帮助生数科技加速技术研究与创新,快速打通商业成功路径,共同做大产业“蛋糕”。
同为领投方的北京市人工智能产业投资基金表示,多模态大模型是 AI 下一阶段发展的关键方向,生数科技在图像、视频、3D 等多模态领域所取得的一系列关键创新成果,在业内获得了广泛认可和高度评价,也充分证明了生数科技的技术实力和行业领先地位。
资本的进入及强度加大,一方面有合作互补的需要,一方面也说明资本对中国大模型公司的信心在增强。
无论对大模型公司还是投资公司而言,这是一个布局未来的时代。
中美差距还有多大?
中美在人工智能领域的竞赛持续升温,双方在技术研发、资本运作、应用场景等方面各有千秋。
美国在算法、算力方面保持优势,尤其像OpenAI这样的头部企业,持续推动行业标准与技术创新。
从人才储备来看,美国在AI领域的研究起步较早,拥有大量的顶尖科学家和工程师,而中国在AI人才队伍建设上仍有待加强。
在研发投入方面,美国的大型科技公司如谷歌、微软等在AI领域的投入力度较大,而中国近年来虽然加大了对AI的投入力度,腾讯、阿里、百度等都不遗余力投入,但整体上仍稍逊于美国。
不过,中国在大数据应用、多模态处理、商业化落地上展现出强劲动力,借助庞大的市场需求和政策扶持,快速缩短与美国的差距。
作为斯坦福大学AI项目团队抄袭的主角,面壁智能联合创始人、首席科学家刘知远表示,2022年底,OpenAI推出ChatGPT,让大众真切感受到AI领域国内外的差距,特别是2023年Llama等国际开源模型发布后,开始有“国外一开源、国内就自研”的说法,但到了2024年的今天,行业从业者也应该看到国内大模型团队如智谱-清华GLM、阿里Qwen、DeepSeek和面壁-清华OpenBMB等,正在通过持续的开源共享,在国际上受到广泛的关注和认可,这次事件也算侧面反映国内创新成果受到的国际关注。
2024年初,OpenAI推出视频大模型Sora,让世人惊叹。DiT和SiT是Sora背后的技术基础。Sora 研发负责人之一 Bill Peebles 与纽约大学助理教授谢赛宁撰写的 DiT(扩散 Transformer)论文《Scalable Diffusion Models with Transformers》被认为是此次 Sora 背后的重要技术基础之一。
彼时生数科技对该技术路线的布局已持续超过一年。2022年9月,生数科技就提出全球首个Diffusion与Transformer融合架构U-ViT。同年12月,美国伯克利团队发表DiT架构。两项工作在架构思路与实验路径上完全一致,均是将Transformer与扩散模型融合。
2023年3月,生数科技再次取得重大突破,曾开源多模态扩散大模型UniDiffuser,在参数量和训练数据规模上与Stable Diffusion直接对齐。除单向的文生图以外,Unidiffuser也支持更通用的图文任务,能够实现图生文、图文联合生成、图文改写等多种功能,成功验证了大规模训练融合架构的可行性与涌现能力。
2024年4月,生数科技联合清华大学发布了国内首款全面对标OpenAI Sora的视频大模型Vidu。Vidu支持一键生成16秒、分辨率1080P的高清视频内容,不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点,性能全面对标国际顶尖水平。
尽管对扩散模型融合架构已有研究基础,但唐家渝坦言,目前与Sora相比还是存在一定差距。不过,唐家渝表示,拥有在大规模GPU集群上实现高效兼容、低成本的模型训练经验之后,追赶Sora肯定比追赶GPT-4轻松很多,预计今年可以达到Sora目前版本的效果。
他表示,能力扩展到3D、长视频的最大限制因素其实是资源。在不确定路线时需要投入大量成本进行实验,而OpenAI用大量资源验证路径可行性实际上打消了很多疑虑。
在商业化落地方面,基于模型即服务的能力,生数科技一方面以API的形式向B端机构直接提供模型能力,主要合作客户集中在游戏公司及互联网企业;另一方面选择研发垂类应用产品,按照订阅等形式收费,目前已经上线视觉创意设计平台PixWeaver、3D资产创建工具VoxCraft。
生数科技大量工作被OpenAI、Stable Diffusion团队引用。生数科技CEO唐家渝认为,多模态大模型的研究仍处于起步阶段,技术成熟度还不高。这一点不同于火热的语言模型,国外已经领先了一个时代。因此,相比于在语言模型上“卷”,唐家渝认为多模态更是国内团队抢占大模型赛道的一个重要机会。
北京智源人工智能研究院副院长兼总工程师林咏华对第一财经记者表示,中国在多模态领域弯道超车是有一定可能性的,但更关键的还是看多模态模型成功要素——依然是算力、算法和数据。目前算法层面,中美团队之间差异没有那么大,算力也不会造成最大问题,行业仍有办法去解决算力问题。数据的问题是阻力最大的,即使智源一直在做AI训练数据扩展,但要获取海量高质量数据,依然难度很大。
谈及中美大模型领域的差距,零一万物董事长兼CEO李开复表示,一年前,中国大模型与OpenAI、Google启动大模型研发的时间点比起来,有7到10年的差距;但如今,中美之间的差距正在不断缩小,目前约为6个月。猎豹移动创始人傅盛则表示在一年左右。
推荐阅读
红杉、高瓴后,华为哈勃投下这家元宇宙领域公司,3D引擎迎风口?
9轮融资,90后创业干将谈Sora的4秒突破|中国未来产业100人
武大教授蔡恒进:元宇宙是人类进入AI世界的入口|中国元宇宙100人